На страницу третьего семестра
Результат работы представлен в таблице:
Аминокислотный остаток в 4-ой позиции белка CYNS_ECOLI | S |
Соответствующий кодон в гене cynS | 5'-UCA-3' |
Идеальный антикодон | 5'-UGA-3' |
Сколько можно было бы ожидать разных тРНК для остатка S, если опираться на генетический код? | 6 |
Сколько разных тРНК для остатка S аннотировано в геноме кишечной палочки? | 4 |
Характеристика выбранной для дальнейшего изучения тРНК: | |
имя гена | serT |
локализация гена в геноме | locus_tag="b0971", 1030848..1030935 |
распознаваемый кодон | UCD |
антикодон | UGA |
Результат поиска всех сериновых
тРНК у Escherichia coli K-12 FT /note="codons recognized: UCY; anticodon: GGA serine tRNA5; FT /note="codons recognized: UCD; anticodon: UGA serine tRNA1; FT /note="codons recognized: UCY; anticodon: GGA serine tRNA5; FT /note="codon recognized: UCG; anticodon: CGA serine tRNA2; FT /note="codons recognized: AGY; anticodon: GCU serine tRNA3; |
Использованные команды:
1.grep codon.*serine ecoli.embl >codon.txt
2.seqret ecoli.embl -sask
Получен файл с последовательностью тРНК (в качестве параментров указывались координаты и имя выходного файла).
Задача найти в геноме Bacillus subtilis последовательность, наиболее похожую на последовательность тРНК из E.coli, выбранную в упр. 1. Поиск надо провести с помощью 4-х разных программ для быстрого поиска сходных нуклеотидных последовательностей.
Таблица 2. Поиск гомологичной т-РНК
Программа | FASTA | BLASTN | MegaBLAST | discontiguous MegaBLAST |
Длина якоря | 6 нуклеотидов | 11 нуклеотидов | 28 нуклеотидов | 11-12 нуклеотидов |
Результаты поиска | ||||
Число находок с E-value < 0,01 | одна находка | нет подходящих находок. наименьший е=0.06 | нет находок | нет подходящих находок, всего одна с е=0.06 |
Характеристика лучшей находки: | ||||
E-value | 2.6e-6 | 0.06 | - | 0.06 |
длина выравнивания | 93 | 24 | - | 24 |
вес выравнивания | 174.8 | 32.2 | - | 32.2 |
координаты в геноме | 22290-22382 | 3171811-3171788(complement) | - | 3171811-3171788(complement) |
Аннотация лучшей находки по записи EMBL: | ||||
имя гена | trnSL-Ser1 | - | - | - |
это тРНК? | да | - | - | - |
это тоже <сериновая> тРНК? | да | - | - | - |
Использованные команды:
formatdb -i bs_genome.fasta -n bs -p F
Были получены три индексных файла (bs.nhr, bs.nsq, bs.nin), составляющих мини-банк данных.
blastall -p blastn -d bs -i UCD.fasta -o resultUCD.txt
Получен файл с одной находкой, причем e-value слишком высокий и не подходит для исследования.
megablast -d bs -i UCD.fasta -D 2 -o megablast.txt
Получен файл, не содержащий находок.
megablast -d bs -i UCD.fasta -D 2 -N 1 -W 11 -t 21 -o dicmegablast.txtПолучен файл с одной находкой, аналогичной находки из BLASTN
fasta34 UCD.fasta bs_genome.fasta 6
Длина якоря - 6. Входные файлы были указаны в командной строке, поэтому нужно было ответить на четыре вопроса: сколько находок показать, показать ли ещё, отображать ли выравнивания и сколько. Получен файл с 4 находками и одним единственным значимым выравниванием.
Сранение эффективности использованных программ. В данном случае, наиболее эффективной оказалась программа FASTA, при небольшой длине якоря, она способна найти сходство на небольших участках последовательностей. Также в данном случае, BLASTN и discontiguous MegaBLAST показали одинаковый результат. Это скорее всего связано с похожими параметрами и длиной якоря. MegaBLAST не обнаружил ни одной находки, длина якоря в этой программе 28 нуклеотидов, таким образом у программы слишком высокий критерий поиска, и для нашей задачи это не подходит.